연속 확률 분포

continuous probability distribution

연속 확률 분포(continuous probability distribution)

- 정규 분포(normal distribution),
표준 정규 분포(z-분포, standard normal distribution)N ( μ , σ²)
- 대수정규 분포 (lognormal distribution)LN (μ , σ²)
- 지수분포 (Exponential distribution)Useful Life , Continuous rates , λ , θ
- 외이블 분포(Weibull distribution)초기고장 형태, β; parameter

정규 분포, 가우시안 분포

다음은 평균을 중심으로 좌우가 대칭인 종 모양을 그리는 정규분포이다.
가우시안 분포라고도 불리며 우리에게 가장 친숙한 확률 분포 가운데 하나이다.
정규 분포의 확률 밀도 함수와 그 그래프는 아래와 같습니다.

확률밀도함수

$$$f(x)=\frac{1}{\sigma \sqrt{2 \pi}} e^{-\frac{1}{2} (\frac{x-\mu}{\sigma})^{2}} \quad , \qquad -\infty <x < \infty $$$ σ 표준 편차, μ 평균

식만 보면 복잡해서 현기증이 나지만 자세히 들여다보면 그다지 어렵지 않습니다. 정규 분포 식에서 변수는 σ와 μ이다.
그 외에 파이나 자연 지수승 등은 고정되어 있는 값이며 그래프가 종모양의 형태가 되게끔 만들어주는 역할을 한다.
μ는 확률 변수 X의 평균이고 σ는확률 변수 X의 표준 편차이다.
종 모양의 그래프는 평균을 기준으로 좌우 대칭이다. 표준 편차가 높을 수록 그래프는 완만한 곡선 형태를 띄게 된다.

표준 정규 분포, z-분포

표준 정규 분포는 평균이 0이고 분산이 1인 정규 분포를 말한다.
이 때의 확률 밀도 함수를 식과 그래프로 표현해보면 아래와 같습니다.

표준정규 분포 확률밀도함수

$$$f(x)=\frac{1}{\sqrt{2 \pi}} e^{-\frac{1}{2} {(x-\mu)}^{2}} , \quad , \qquad -\infty <x < \infty $$$

정규 고장률 함수
$$$ h(x)=\frac{f(x)}{R(x)}=\ \phi z \sigma [{1-\phi z}] $$$> $$$ R(t)=e^{-\int_{-\infty}^{\infty}h(x)dx}=e^{-\int_{-\infty}^{\infty}2x dx}=e^{-x^2} $$$

확률 밀도함수
$$$ f(x)=hx ·Rx =2x · e-x2 $$$

이름에서도 알 수 있듯이 (normal distribution)현실 세계의 많은 데이터들은 정규분포를 따르고 있다.
하지만 각 집단의 평균과 표준 편차가 모두 다르기 때문에 데이터들을 서로 비교하기가 어렵습니다.
예를 들어 A반의 수학 점수가 평균은 70점이고 표준 편자는 30점이다.
반면 B반은 평균 65점에 표준 편차가 10점이라면 두 반 중 어느 반이 더 수학 점수가 높다고 할 수 있을까요?

이러한 비교를 위헤서 전체 데이터를 평균으로 빼주고, 표준 편차로 나누어 주는 표준화(standardizing)작업을 거치게 된다.
그 결과 두 집단의 수학 점수는 동일하게 표준 정규 분포, z-분포를 따르게 되며 수식으로는 아래 처럼 표현할 수 있다.
표준화를 거친 개별 데이터를 우리는 z-score라고 부릅니다.
Z값(Z-value), Z 점수(Z score), 확률변수
$$$ Z=\frac {x-\mu}{\sigma}$$$ 평균으로 부터 몇 σ 떨어져 있나

표준 정규 분포의 중요한 특징 중에 하나는 이를 활용하여 확률 구간을 계산할 수 있습니다는 것이다.
평균 0을 기점으로 ±1σ 안에는 전체 데이터의 68.2%가 들어오게 된다.
마찬가지로 ±2σ 안에는 전체 데이터의 95.4%, ±3σ 안에는 전체 데이터의 99.7%가 들어옵니다.
더 자세한 내용은 신뢰 구간과 관련된 포스팅에서 다뤄보도록 하겠습니다.

대수(로그)정규 분포 (Lognormal Distribution.)[Ⅳ-32 ]

복잡한 시스템의 수리 : 진단시간이 오래 걸림
LN (3.1, 0.32), Cf = 95%
ln t = 3.1 + Z5% x 0.3
$$$ t=e^{ln{t}} $$$
※ 확률변수의 곱은 표본크기가 커짐에 따라 개별분포에 상관없이 대수 정규분포가 됨

확률밀도함수

$$$f(x)=\frac{1}{\sigma \sqrt{2 \pi}} e^{-\frac{1}{2} (\frac{\ln x-\mu}{\sigma})^{2}} \quad , \qquad x >0 $$$ 여기에서 μ 는 위치모수 즉 개별값들의 자영로그 평균이다
σ 는 척도모수 즉 개별값들의 자영로그 평균이다

불신뢰도 , 신뢰도[Ⅳ-34 ]

참조
$$$ F(x)=\phi lnx -μσ $$$
$$$ R(x)=1-\ \phi lnx -μσ $$$
주)F(x) R(x)= 1

잘린 정규 분포(truncated normal distribution)

truncated distribution이란 확률 변수가 존재할 수 있는 범위에 최대 값 혹은 최소값을 정하여 자른 분포를 의미한다.
잘린 정규 분포란 이러한 truncated distribution을 정규 분포에 적용한 분포로 수식과 그래프는 아래와 같습니다. $$$ f(x;\mu,\sigma,\alpha,b)=\frac{1}{\sigma} \frac{\Phi(\frac{x-\mu}{\sigma})} { \Phi(\frac{b-\mu}{\sigma}) -\Phi(\frac{\alpha-\mu}{\sigma})} $$$

위 그래프를 보시면 정규 분포의 확률 밀도 함수가 -10부터 10 사이에서 범위가 제한되어 있는 모습을 볼 수 있다.
이처럼 특정 확률 분포에 범위를 제한하는 것을 truncated distribution이라 부릅니다.

와이블 분포

확률밀도함수

3모수 와이블 분포함수 $$$ f(x)=\frac{\beta}{\theta} (\frac{x-\delta}{\theta})^{\beta-1}·\exp -(\frac{x-\delta}{\theta})^{\beta}\quad, \quad x≥\delta $$$ $$$ f(x)=\frac{\beta}{\eta} (\frac{x-\gamma}{\theta})^{\beta-1}·\exp -(\frac{x-\gamma}{\eta})^{\beta}\quad, \quad x≥\gamma$$$ β ,형상 모수 (shape parameter)
β= 1 지수분포 , 2 Rayleigh 분포 , 3~4 정규분포
θ , η ; 척도 모수 (scale parameter), 분포의 폭
그래프 죄측 신뢰도: 63.2% (일반적으로 수명이라 이해함)
작아지면 좌측으로 압축됨 (compressed to the left)
δ , Γ 위치 모수 (location parameter)

고장률 함수

와이블 고장률 함수는 형상 모수값에 의하여 결정된다.
$$$ h(x)=\frac{\beta}{\theta} (\frac{x-\delta}{\theta})^{\beta-1}$$$ β < 1, 고장률 일정, 지수분포
β=1, 고장률 일정, 지수분포

신뢰도 함수

$$$ R(x)=e^{-(\frac{x-\delta}{\theta})^\beta} $$$ If δ=0
$$$ R(x)=e^{-(\frac{x}{\theta})^\beta} $$$ $$$ \ln R(x)=-(\frac{x}{\theta})^\beta $$$

신뢰도 달성 시간
$$$ t =\ {\ \mathrm{\ \theta}\ \ (-\ln{R)\ }}^\frac{1}{\beta} $$$ R = 0.9 , β =2 , θ = 300개월

와이블 분포

평균 및 분산 (Γ Table 사용)

3모수 와이블 분포의 평균 및 분산
$$$ \sigma^2=\theta^2\ \left[\Gamma (1+\frac{2}{\beta})-\Gamma^2(1+\frac{1}{\beta})\right] $$$ $$$ \mu=\theta \Gamma (1+ \frac{1}{\beta}) \delta $$$

지수 분포 (Exponential Distribution.)[Ⅳ-37 ]

지수 분포는 고장률이 일정한 항목(대개 전자제품)을 모형화하는 데 사용된다.
지수분포 : 확률 , 포아송 분포 : 일년에 몇 번 (횟수)

확률밀도함수

$$$ f(x)=\frac{1}{\theta}\cdot e^{-\frac{x}{\theta}}= \lambda e^{- \lambda x} \quad , \quad \lambda \geq 0 $$$ θ 평균 , 척도모수 , λ 고장률
지수분포의 평균과 표준편차는 같다
평균수면 추정 (MTTF)수명시간 추정 (B1 , B10)
신뢰성 보증시험
설계 초기 단계에 신뢰성 목표(수명)를 달성하였는지를 평가하기 위한 시험
포아송 분포(Poisson distribution)는 일년에 몇 번으로 나타난다.

신뢰도 함수 [Ⅳ-38 ]

$$$ R(x)= e^{-\frac{x}{\theta}}=e^{\lambda x} , \quad , \quad \lambda \geq 0 $$$ 정규분포와의 비교 : $$$ z_P=\frac{t-\theta}{\sigma} $$$

- 고장률 함수 [Ⅳ-38 ]

$$$ h(x)=\frac{1}{\theta}=\lambda $$$
$$$ h(x)=\frac{f(x)}{R(x)}=\frac {\lambda e^{-\lambda x}}{e^{-\lambda x}}=\lambda $$$

사후보전 : lognormal
단순교체: Normal
$$$ M(t)=1-e^{-\frac{t}{MTTF}} $$$